查看原文
其他

蛋白质二级结构、结构域及蛋白修饰预测

叶明皓 聊生信 2022-05-14
一般情况,蛋白质结构分为4个层次:1、一级结构(蛋白质序列水平,跨膜结构等);2、二级结构(α螺旋、β折叠等);3、三级结构(多态链的空间结构);4、四级结构(多个亚基形成的空间结构)。
蛋白质结构预测是指基于蛋白质的氨基酸序列预测出其二级和三级结构,有助于理解蛋白质结构和功能的关系,并在此基础上进行蛋白质突变体设计和药物开发等具有重要意义。二级结构预测常称为三态预测,可归结为螺旋(helix,H)、拉长的折叠股(extended β strand,E)或卷曲(coil,C)三种状态。目前预测二级结构的方法有三大类:统计学方法、基于立体化学原则的物理化学方法和神经网络与人工智能方法。

科学出版社生物信息学(第二版)

下文仍旧以镰刀状贫血症致病基因HBB蛋白为例。HBB蛋白序列:

>CAG38767.1 HBB [Homo sapiens]

MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH

蛋白三维结构模型(cartoon; form SWISS-MODEL)。

详见:蛋白结构预测工具SWISS-MODEL和Phyre2

二级结构预测

PSIPRED是由英国伦敦大学学院(University College London)生物信息学小组开发,该小组的主要目标是开发和应用最先进的计算技术来解决生命科学中出现的问题。

网址:http://bioinf.cs.ucl.ac.uk/psipred/

进入网站后,选择二级结构预测的算法PSIPRED 4.0(可能会更新),在红框输入目的序列,起名并输入邮箱地址

输出结果如下图,可保存为PNG或SVG格式

预测结果:粉红色为Helix,灰色线为Coil,无 β strand。

结构域预测

蛋白质结构域(domain)是在较大的蛋白质分子中,由于多肽链上相邻的超二级结构紧密联系,形成两个或多个在空间上可以明显区别的局部区域结构域与分子整体以共价键相连,一般难以分离。

SMART是一个常用来进行结构域检索的工具,它集成了很多蛋白结构预测和功能分析的工具。在信号传递、细胞外和染色质相关蛋白中发现了超过500个结构域家族。还可以预测蛋白的一些二级结构:信号肽(Signal peptides)、Pfam蛋白结构域(PFAM domains)等。

网址:http://smart.embl.de/

SMART 有两种模式(红色方框),NORMAL使用的数据库包含 Swiss-Prot, SP-TrEMBL 和stable Ensembl proteomes;在GENOMIC中,只使用完整地测过全基因组序列的蛋白质组。

1、单序列检索

输入网址进入主页,输入需要检索的序列ID(Uniprot/Ensembl ID)(红框),或者直接输入氨基酸序列(黄框),并进行参数设置(蓝框,有的蛋白可不选,有的必选)。

提交任务后,等待数秒得到如下预测结果,点击SAVE可下载SVG格式的矢量图

点击结构域,可查看结构域具体位置信息(如:位置,E值,结构域描述等)

HMMER: biosequence analysis using profile hidden Markov models(隐马尔可夫模型)

预测结果:结构域的氨基酸位置(8到112,共105aa)。相关功能:参与结合和(或)运输氧气。
注意到镰刀状贫血症的一个致病突变(Glu7Val,rs334)并不处于Globin结构域中,这可能导致HBB蛋白的携氧功能未完全破环,但改变了蛋白的亲疏水性和表面电荷(更容易相互聚集)。
最终非常“聪明地”使HBB突变蛋白既保留了一定的携氧能力,也具备了一定的脆性(抵抗疟原虫寄生)
再回顾一下相关的致病机制模式图:

2、多序列检索

如需进行批量检索,可点击问号(help),再点击batch access进入链接

进入如下界面后,可以在红框中填入多个序列或是直接上传带有多个序列文件

得到搜索结果后,可直接查看列出的结构域


磷酸化和糖基化位点预测

磷酸化

前体蛋白是没有活性的,常常要进行一个系列的翻译后加工,才能成为具有功能的成熟蛋白。磷酸化修饰能够调控信号转导、基因表达、细胞周期等诸多细胞过程,这种修饰的异常与疾病发生有着密切关系。可通过NetPhos 3.1 Server在线预测磷酸化位点。

网址:http://www.cbs.dtu.dk/services/NetPhos/

进入网站后,在红框内输入目的序列或提交FASTA文件,蓝框表示预测磷酸化位点的选择,并提交

结果如下图,磷酸化位点T表示苏氨酸,Y代表酪氨酸,S代表丝氨酸,粉线表示阈值,在阈值之上的结果被预测为磷酸化位点,可点击鼠标右键保存图片。

糖基化

糖基化是对蛋白也有重要的修饰作用,有调节蛋白质,帮助蛋白质折叠功能作用。可通过NetNGlyc 1.0 Server在线预测糖基化位点。

网址:http://www.cbs.dtu.dk/services/NetNGlyc/

进入网站后,在红框内输入目的序列或提交FASTA文件,并提交

结果如下,红框表示糖基化位置,红线表示阈值,在阈值之上的结果被预测为磷酸化位点,可点击鼠标右键保存图片。




相关链接(蛋白三级结构预测、分析及可视化):
正常与突变蛋白三维结构模型的绘制与分析
蛋白结构预测工具SWISS-MODEL和Phyre2
AlphaFold数据库简介
基因突变与脑瘫发生风险(文献解读,Nature Genetic,2020)
蛋白质生物学推介(系列文章)


撰写:叶明皓
校对:宋红卫

更多人类遗传学知识、文献和分析技术
请关注和星标聊生信

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存